اخبارآموزش و اخبار هوش مصنوعی

هوش مصنوعی حالا از همیشه باهوش تره

بررسی تخصصی بنچمارک ها و قابلیت های جدید GPT-5

بالاخره  جدید ترین نسخه gpt معرفی شد مدلی که شایعات زیادی در موردش گفتن

بعضی ها اونو در ادامه آپدیت  gpt4 نمیدونستن و منتظر اتفاقات جدید تری بودن.

اما این مدل دقیقا چه آپدیت هایی داده؟

چقدر از gpt-4 قوی تره؟

آیا به هوش انسانی رسیدیم یا فقط نسخه باهوش تر مدل قبلیه؟

بریم که یه بررسی کامل از نسخه جدید داشته باشیم.

۱. منطق پیشرفته و تفکر زنجیره ای  (Chain-of-Thought)

gpt‑5 خیلی هوشمند تر و واقعی تر شده  تو مدل های قبلی سریع جواب میده گاهی حتی بدون اینکه فکر کنه اما تو مدل جدید مخصوصا تو مسائل چند مرحله ای میتونه خیلی عمیق تر فکر کنه و تصمیم گیری بهتری هم بکنه این بخاطر ترکیب مدل های reasoning مانند o1 و o3 هست .

۲. سرعت و تطبیق هوشمند پاسخ (Auto-Routing)

مدل جدید تصمیم میگیره که سریع پاسخ بده یا اینکه در مورد مسایل با دقت فکر کنه و بعد پاسخ بده وجواب هوشمند تر و دقیق تری میده.

۳. عملکرد در کدنویسی ( بنچمارک‌های SWE-Bench و Aider)

gpt‑5 در زمینه کدنویسی رکوردهای خیلی خوبی ثبت کرده

  • SWE-Bench Verified: امتیاز 74.9٪
  • Aider Polyglot: امتیاز 88٪
  • این عملکرد نسبت به مدل Claude Opus 4 در SWE-Bench بهتره (Claude Opus 4 حدود 74.5٪) .

 

۴. بنچمارک‌های حوزه سلامت  Health Bench

در زمینه مسائل پزشکی، مدل “thinking” gpt‑5

Health Bench Hard: امتیاز 46.2٪ به دست آورده

(با هشدار Open AI که جایگزین پزشک نیست) .

۵. افزایش دقت و خیال بافی کمتر (کاهش توهم hallucination)

یعنی چی؟

یعنی gpt5 خیلی کمتر از مدل های قبلی جواب پرت و پلا میده 

تو نسخه جدیدش نسبت به مدل O3 حدود 65 درصد کمتر توهم میزنه .

در مقایسه با 4O  هم حدود 26 درصد کمتر دچار  خطا میشه

۶. حافظه خیلی بیشتر شده!

gpt-5 حافظه‌ش واقعاً زیاد شده!

الان می‌تونه تا ۲۵۶ هزار تا کلمه رو توی ذهنش نگه داره و فراموش نکنه.

یعنی حتی اگه یه متن خیلی طولانی بهش بدی، هنوز حرف‌هات یادش می‌مونه و قاطی نمی‌کنه.

 قبلاً گاهی اوقات مدل‌ها وسط راه همه‌چی رو یادشون می‌رفت، الان دیگه این‌جوری نیست.

۷. یه مقایسه با رقبا: Gemini Ultra و Claude 3.7

حالا بیایم ببینیم تو رقابت با بقیه چی کار کرده:

• تو تستای زبانی (یعنی فهم و درک متن)، gpt-5 یه ذره بهتر از Gemini Ultra ظاهر شده.

• تو برنامه‌نویسی هم قوی‌تره؛ ۸۷ درصد سوالا رو درست جواب داده، در حالی که Gemini Ultra حدود 83 درصد.

• توی ریاضی هم بازم یه ذره جلوتره (۹۴.۲٪ مقابل ۹۳.۵٪).

 

در مقایسه با Claude 3.7:

• توی استدلال و منطق، Claude یه کم از gpt-5 بهتره.

• اما توی برنامه‌نویسی، gpt-5 قوی‌تره.

• سرعتش هم بیشتره (یعنی جواب‌ها رو سریع‌تر می‌نویسه).

• البته Claude توی کار با ابزارها و انجام دستورها یه مقدار حرفه‌ای‌تره.

خلاصه اینکه تو بیشتر زمینه‌ها gpt -5 جلو زده، ولی هر مدلی یه نقطه قوت داره!

برای استفاده از قابلیت‌های جدید GPT-5، نیاز به یک اکانت هوش مصنوعی یا همان اکانت ChatGPT داری که از نسخه جدید پشتیبانی کند. 

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *